Datenvisualisierung in R

Was ist eigentlich eine gute Grafik?

Kursübersicht

Ein Bild sagt mehr als tausend … Zahlen! Mit einer guten Grafik lassen sich viele Informationen übersichtlich darstellen, Sachverhalte schnell erkennen und auch an Laien komplizierte Datenlagen verständlich kommunizieren. Dabei ist eine gute Visualisierung nicht einfach: komplexe Inhalte müssen klar, präzise und effizient dargestellt werden und sollen idealerweise auch noch hübsch aussehen. In diesem Kurs lernen Teilnehmende die Grundprinzipien des „Analytical Design“ (Edward Tufte) sowie verschiedene Visualisierungsformen zur Exploration und Kommunikation univariater und multivariater Daten kennen. In diversen Übungen können sie diese Grundprinzipien bei der Erstellung von eigenen Grafiken in ggplot2 und Erweiterungen wie gganimate selbst erproben.

Kursleiter

Nicklas Hafiz ist Psychologe und promoviert am Institut zur Qualitätsentwicklung im Bildungswesen (IQB) zu Simulationsstudien in der psychologischen Methodenforschung. Teil seiner dortigen Arbeit ist zudem die Entwicklung eines R-Pakets zur Erstellung der Grafiken für den Bildungstrend-Bericht. Zudem verfügt er über Erfahrung in der Lehre und hat bereits Veranstaltungen und Workshops zu R, Item-Response-Theorie sowie zu reproduzierbarem Arbeiten mit GitHub durchgeführt.

Dr. Janine Buchholz ist ebenfalls Psychologin und arbeitet als Postdoktorandin im Forschungsdatenzentrum am Institut zur Qualitätsentwicklung im Bildungswesen (FDZ am IQB) in Berlin. Sie hat am DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation zu mehrdimensionalen Modellen der Item-Response-Theorie promoviert und über mehrere Jahre in unterschiedlichen Rollen an der PISA-Studie mitgewirkt. Sie verfügt über Lehrerfahrung zu verschiedenen Methoden der empirischen Bildungsforschung und Datenvisualisierung.

Voraussetzungen

Voraussetzungen für die Teilnahme sind Grundkenntnisse in R. Grundsätzlich können die im Kurs behandelten Inhalte aber auch in anderen Programmiersprachen umgesetzt werden. Zur Teilnahme benötigen Sie eine lokale Installation von R und RStudio (https://posit.co/download/rstudio-desktop/); alternativ können Sie sich einen kostenfreien (aber zeitlich begrenzten!) Workspace auf der Posit Cloud einrichten (https://login.posit.cloud/)

Zeitplan

Tag 1

Tag 2

Setup

R-Pakete

Installiert euch gerne schon einmal die Pakete, die wir im Workshop verwenden werden.

install.packages(c("colorblindcheck", "dplyr", "gerda", "GGally", "gganimate", "ggimage", 
                   "ggplot2", "ggrepel", "ggridges", "ggtext", "ggthemes", "ggview", 
                   "ggwordcloud", "glue", "here", "htmlwidgets", "janitor", "paletteer", 
                   "patchwork", "plotly", "quartets", "RColorBrewer", "readxl", "scales", 
                   "sf", "showtext", "tidyr", "tidyverse"))

Cryptpad

Zum unkomplizierten Austausch von Code-Schnipseln im Workshop nutzen wir dieses Cryptpad: https://cryptpad.fr/code/#/2/code/edit/YH8EkvdnTZaCixuDViTP00VA/

Leistungsnachweis

Format: Schriftliche Ausarbeitung

Erzählt uns eine Geschichte! Suche Dir ein paar spannende Variablen und fertige einen kleinen Bericht an, in dem die Verteilungen bzw. Zusammenhänge dargestellt werden.

  • Nutze dafür einen der Datensätze, die wir im Workshop verwendet haben.
  • Nutze mindestens zwei Grafiktypen (z.B. Line Plot und Scatterplot)
  • Diskutiere jeweils, welche Änderungen Du an der Grafik vorgenommen hast, damit diese den Gestaltungsprinzipien guter Grafiken entspricht (z.B. Vergabe eindeutiger Achsenbeschriftungen, Anspassung von Größenverhältnissen, Verwendung eines bestimmten Themes oder Farbschemas).
  • Umfang:
    • schriftliche Ausarbeitung (ca. 2-3 Seiten)
    • R Skript zur Erzeugung der Grafiken

Einreichung